Manipulation de données bibliométriques via {managHAL}

Martin AMIENS

MIA - Paris-Saclay

2024-04-07

Martin AMIENS

  • Stagiaire au sein de l’unité MIA - Paris-Saclay.
  • Etudiant en première année du master Bio-Informatique et Bio-Statistiques à Paris-Saclay.
  • Tuteurs : Julie AUBERT, Pierre BARBILLON

Plan

  • Contexte du stage
  • Objectifs du stage
  • Accessibilité et généricité de {managHAL}
  • introduction aux Réseaux
  • Ajout de fonctionnalités à {managHAL}
  • Perspectives et avenir du package

Contexte

  • DRIT : Direction des Recherches et de l’Innovation Technologique
  • Sciences Ouvertes : sont “la diffusion sans entrave des publications et des données de la recherche.” (plan-national-pour-la-science-ouverte,2021)
  • HAL : Hyper Articles en Ligne

Crédit : CCSDForge
  • {ManagHAL} : Package R d’extraction de données bibliométriques de HAL

Objectifs du stage

  • Accessibilité et généricité de {managHAL}
  • Ajout de fonctionnalités à {managHAL}

Accessibilité et généricité de {managHAL}

Exemple d’URL : “https://api.archives-ouvertes.fr/search/hal/?q=structId_i:1002311&fq=publicationDate_tdate:[2022-01-01T00:00:00Z%20TO%202023-01-01T23:59:59Z]&fq=docType_s:(COMM+OR+ART … &sort=producedDate_tdate+desc&fl=docid,halId_s,version_i,docType_s,citationFull_s … &defType=edismax&rows=1000”

Accessibilité et généricité de {managHAL}

# A tibble: 3 × 13
  civilite nom       prenom statut rattachement  debut_contrat fin_contrat
  <chr>    <chr>     <chr>  <chr>  <chr>         <chr>         <chr>      
1 M.       ADJAKOSSA Éric   CEC    AgroParisTech ""            ""         
2 Mme      AUBERT    Julie  IR     INRAE         ""            ""         
3 M.       BARBILLON Pierre PR     AgroParisTech ""            ""         
# ℹ 6 more variables: financement <chr>, equipe <chr>, unite <chr>,
#   orcid <chr>, idhal <dbl>, adresse_mail <chr>
# A tibble: 1 × 11
    docid halId_s      version_i docType_s citationFull_s          citationRef_s
    <int> <chr>            <int> <chr>     <chr>                   <chr>        
1 4440523 hal-04440523         1 COMM      Isabelle Lebert, Maxim… Colloque fin…
# ℹ 5 more variables: publicationDate_tdate <chr>,
#   authFullNamePersonIDIDHal_fs <chr>, structAcronym_s <chr>,
#   structId_i <chr>, structHasAlphaAuthIdHalPersonid_fs <chr>
# A tibble: 4 × 8
    docid halId_s      version_i docType_s citationFull_s          citationRef_s
    <int> <chr>            <int> <chr>     <chr>                   <chr>        
1 3781287 hal-03781287         1 COMM      Wenfan Cao, Maxime Lec… FOODMICRO 20…
2 3694338 hal-03694338         1 COMM      Wenfan Cao, Maxime Lec… 23ème éditio…
3 3811607 hal-03811607         1 COUV      Julie J. Aubert, Pierr… Statistical …
4 4019111 hal-03604836         1 ART       Sana Romdhane, Aymé Sp… The Internat…
# ℹ 2 more variables: publicationDate_tdate <chr>,
#   authFullNamePersonIDIDHal_fs <chr>

Introduction aux Réseaux

Un réseau est composé de :

  • noeuds (entités)

  • arêtes (interactions entre ces entités)

A : Exemple de Réseau trophique (réseau d’interactions des espèces chiliennes), Crédit : (Kéfi et al. 2016)

B : RAD51 et son réseau d’interactions de sa famille de gènes, Crédits : (Li et al., 2021)

Ajout de fonctionnalités à {managHAL}

construction d’un réseau de co-auteur et SBM

Réseau complet de co-auteurs de l’unité MIA - PS

Réseau complet de co-auteurs de l’unité MIA - PS coloré par appartenance aux groupes

Ajout de fonctionnalité à {managHAL}

Création de sous-groupe

Réseau partiel de co-auteurs de l’unité MIA - PS

Réseau partiel de co-auteurs de l’unité MIA - PS coloré par appartenance aux groupes

Cas d’usage

L’unité MIA - Paris-Saclay 1

information_regarding_the_contract_date civilite nom prenom statut rattachement
193653S M. ADJAKOSSA Éric CEC AgroParisTech
17504B Mme ALBERT Isabelle CR INRAE
N/A M. ALLYNDREE Joseph Doctorat AgroParisTech
188167H Mme ALVAREZ Isabelle IPEF INRAE
199531G M. ANAKOK Emré Doctorat INRAE
20245F Mme AUBERT Julie IR INRAE

présenter le chargement de la table RH (comment on fait au niveau utilisateur)

présenter le chargement des publications à partir d’identifiants auteurs.

présenter le chargement à partir d’un identifiant structure

L’unité MIA - Paris-Saclay 2

présenter la création d’un rapport bibliographique

integrer le lien vers html rapport ?

L’unité MIA - Paris-Saclay 3

présenter les fonctions de nettoyages des données ( + les conclusions que on peut en tirer)

L’unité MIA - Paris-Saclay 4

présenter la création de réseau

L’unité MIA - Paris-Saclay 5

présenter le sbm

Questions importantes à poser

  • ids à garder ?

  • detections des publis non mises en ligne ?

Perspectives et avenir du package

  • Création et optimisation des fonctions permettant la création d’un réseau à partir des données

  • Création et optimisation des fonctions permettant la création d’un modèle à partir du réseau obtenu

Merci de m’avoir écouté

sources

https://www.ouvrirlascience.fr/plan-national-pour-la-science-ouverte/